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SEQ ID NO: 365 

RESULT 4 
AAA97368 

ID AAA97368 standard; cDNA; 5277 BP. 
XX 

AC AAA97368; 
XX 

DT 29-JAN-2001 (first entry) 
XX 

DE Human colorectal cancer modulator protein BCN5 cDNA. 

KW Colorectal cancer modulator protein; CCMP; human; expression profile- 

kw drug screening; diagnosis; prognosis; antibody; vaccine; BCN5; 

KW immunogenic; gene therapy; targetting moiety; CCMP inhibitor; tumour; ss . 

OS Homo sapiens . 
XX 

PN WO200055633-A2. 
XX 

PD 21-SEP-2000. 
XX 

PF 15-MAR-2OO0; 2000WO-US0704 . 
XX 

PR 15-MAR-1999; 99US-0268866 . 
PR 09-NOV-1999; 99US-0435945 . 
PR 09-NOV-1999; 99US-0436983 . 
PR 29-NOV-1999; 99US-0450857 . 
PR 02-DEC-1999; 99US-0453850 . 

PR 28-JAN-2000; 2000US-0493444 . 
XX 

PA (EOSB-) EOS BIOTECHNOLOGY INC. 
XX 

PI Mack D, Gish KC, Wilson KE; 
XX 

DR WPI; 2000-638217/61. 
XX 

PT use of expression profiles, nucleic acids and proteins involved in 

PT colorectal cancer for diagnosis and prognosis of colorectal cancer and 

PT identifying candidate agent and/or targets which modulate colorectal 

PT cancer - 

XX 

PS Claim 1; Fig 45; 308pp; English. 
XX 

CC The invention relates to the use of expression profile nucleic acids 

CC encoding colorectal cancer modulator proteins (CCMPs) for screening 

dru 9 candidates and bioactive agents capable of binding and/or 

CC modulating CCMPs; for evaluating the effect of drugs for the treatment of 

cc colorectal cancer; for the diagnosis and prognosis of colorectal cancer; 

CC and as a target for colorectal cancer therapy. The expression profile 

~~ 2rvo ^^ ldS U f Sd in the meth °ds of the invention encode the CCMPs CZA8, 

™' ! ' CBC1 ' CBC3 ' CJA8 ' CJA9 ' CGA7 ' BCN5 ' °Q A1 ' BCN7 , CQA2, CAA2, 

CC CAA9_and CGA8 . The CCMPs (especially CJA8 (AAB23166) ) may be used in 

CC vaccine compositions, and also to raise antibodies for use as therapeutic 

CC agents, or targetting moieties for therapeutic agents in the treatment 

CC of colorectal cancer. Inhibitors of CCMP activity may also be used in 

cc the treatment of other tumours. CCMP nucleotides, especially those 

CC encoding CJA8, may be used in gene therapy, and in genetic vaccines. 

CC Sequences AAA97355-A97371 represent nucleic acid sequences encoding a 

^C variety of colorectal cancer modulator proteins. 



Sequence 5277 BP; 1652 A; 1088 C; 1133 G; 1399 T; 5 other; 

Query Match 99.9%; Score 4830.4; DB 21; Lenath 5277 • 

Best Local Similarity 99.9%; PredU No. 0; 

Matches 4828; Conservative 5; Mismatches 1; indels 0; Gap; 

1 GATGTGGAGCTGGGGTCCCTGCAAGTCATGAACAAAACGAGAAAGATTATGGAACATGGG < 



I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I ] | [ | | 1 | | | | | | | | | | | | I I I I | | 
GATGTGGAGCTCGGGTCCCTGCAAGTCATGAACAAAACGAGAAAGATTATGGAACATGGG 4 75 

61 GGGGCCACCTTCATCAATGCCTTTGTGACTACACCCATGTGCTGCCCGTCACGGTCCTCC 1 2 0 
,„ 1 1 1 1 1 1 I I I I I I I I M I I I I t I I I I i | [ f | | | | M ! I I I I I I I I | | | I I II I I I I f I I I i 
476 GGGGCCACCTTCATCAATGCCTTTGTGACTACACCCATGTGCTGCCCGTCACGGTCCTCC 535 

121 AT GC T C AC C G G GAAG T AT G T G C AC AAT C AC AAT G T C T AC AC C AAC AAC GAG AAC T GC T C T 180 

co NNINMII III Mill II lUMIIIMIMM II Mill IMIMIIM Mill M 

536 ATGCTCACCGGGAAGTATGTGCACAATCACAATGTCTACACCAACAACGAGAACTGCTCT 595 

181 TCCCCCTCGTGGCAGGCCATGCATGAGCCTCGGACTTTTGCTGTATATCTTAACAACACT 240 

cn t I II I M M II II II M M II I I I I I || M M II I I II II I I I II I I I I I I II | I I I I II 

596 TCCCCCTCGTGGCAGGCCATGCATGAGCCTCGGACTTTTGCTGTATATCTTAACAACACT 655 

241 GGCTACAGAACAGCCTTTTTTGGAAAATACCTCAATGAATATAATGGCAGCTACATCCCC 300 

rcr I I I I i I M I I I I I M M I I I I I'M II M I I I M I || || | |( || || | || | | || | || | | M | 

656 GGCTACAGAACAGCCTTTTTTGGAAAATACCTCAATGAATATAATGGCAGCTACATCCCC 715 

301 CCTGGGTGGCGAGAATGGCTTGGATTAATCAAGAATTCTCGCTTCTATAATTACACTGTf 360 

„, I M I ! M II II M I II M II i I II I I || | | M I I II I I M I I I I I I I I I I | | | M 

716 CCTGGGTGGCGAGAATGGCTTGGATTAATCAAGAATTCTCGCTTCTATAATTACACTGTT 775 

3 61 TGTCGCAATGGCATCAAAGAAAAGCATGGATTTGATTATGCAAAGGACTACTTCACAGAC 420 

I 1 1 1 I I I M M M I I M t I II M I M I M I I I M I I M I M I I I I I I I I II I I I II I I I I 
T G T C GC AAT GGCAT C AAAGAAAAG CAT GGAT T T GAT TATGC AAAGGAC TAG T T CACAGAC 835 

TTAATCACTAACGAGAGCATTAATTACTTCAAAATGTCTAAGAGAATGTATCCCCATAGG 4 8 0 
Ml] N I I I I M I I I I i I I I I II I I I II I I M I I M II I II I M II I I I I I M I II I I I I 
TTAATCACTAACGAGAGCATTAATTACTTCAAAATGTCTAAGAGAATGTATCCCCATAGG 895 

CCCGTTATGATGGTGATCAGCCACGCTGCGCCCCACGGCCCCGAGGACTCAGCCCCACAG 540 
' ' I I I I I I I I M I I ! I I I I | I | II II I II II I I I II I I I I | | II M I M M II I I I I I I I 
CCCGTTATGATGGTGATCAGCCACGCTGCGCCCCACGGCCCCGAGGACTCAGCCCCACAG 955 

T T T T C T AAAC T G T AC C C C AAT G C T T C C CAAC AC AT AAC T C C AG T TAT AAC TAT G C AC C A 600 
INI N I M I II I I I I I I I M 1 I I I M I I I I M I II I I I I I I I I I I | I | | | || | | m | | | 
TTTTCTAAACTGTACCCCAATGCTTCCCAACACATAACTCCTAGTTATAACTATGCACCA 1015 

AATATGGATAAACACTGGATTATGCAGTACACAGGACCAATGCTGCCCATCCACATGGAA 660 

II 11 N I I I I I I I I M I I I I M I I I I | | || | | M II I I I I I I I I | H I I M I I i i i i i i i 
AATATGGATAAACACTGGATTATGCAGTACACAGGACCAATGCTGCCCATCCACATGGAA 1075 

TTTACAAACATTCTACAGCGCAAAAGGCTCCAGACTTTGATGTCAGTGGATGATTCTGTG 72 0 
M 11 N II I I M II I II M I I 1 I I I I I I I I | | M 1 II I I II II I I I I I I I I i I | | | | M I 
TTTACAAACATTCTACAGCGCAAAAGGCTCCAGACTTTGATGTCAGTGGATGATTCTGTG 1135 

721 GAGAGGCTGTATAACATGCTCGTGGAGACGGGGGAGCTGGAGAATACTTACATCATTTAC 780 
N I II I II II I I M I I I I I | || I I I I I II I II I I I I I I | | | || I I I I I I I I I I I M I I I I 
1136 GAGAGGCTGTATAACATGCTCGTGGAGACGGGGGAGCTGGAGAATACTTACATCATTTAC 1195 

781 ACCGCCGACCATGGTTACCATATTGGGCAGTTTGGACTGGTCAAGGGGAAATCCATGCCA 84 0 
N I N I I I | | I I I I | M | || | | | | | | | M II I I I I M I I 1 I I I I I I I I I f I I II II I I M 
1196 ACCGCCGACCATGGTTACCATATTGGGCAGTTTGGACTGGTCAAGGGGAAATCCATGCCA 1255 



776 



836 



896 



1016 



1076 



Qy 841 TATGACTTTGATATTCGTGTGCCTTTTTTTATTCGTGGTCCAAGTGTAGAACCAGGATCA 900 

1 I ! I 1 I I M 1 I I I I I M I I II t I I I M I II 11 M II I I I I I 1 I! M I I I I I I I II I I I I I 
Db 125 6 TATGACTTTGATATTCGTGTGCCTTTTTTTATTCGTGGTCCAAGTGTAGAACCAGGATCA 1315 

Qy 901 ATAGTCCCACAGATCGTTCTCAACATTGACTTGGCCCCCACGATCCTGGATATTGCTGGG 960 

I I II I II I I II II II I I II II I II II M I M II I II I I I II I II I II I [ II II I II I I I I 
Db 1316 ATAGTCCCACAGATCGTTCTCAACATTGACTTGGCCCCCACGATCCTGGATATTGCTGGG 1375 

Qy 961 CTCGACACACCTCCTGATGTGGACGGCAAGTCTGTCCTCAAACTTCTGGACCCAGAAAAG 102 0 

I I I II I i I II ! ! M I II li I II M I M II II I II II I II I I I I II I I II II 1 I I I I I I I I 
Db 137 6 CTCGACACACCTCCTGATGTGGACGGCAAGTCTGTCCTCAAACTTCTGGACCCAGAAAAG 1435 

Qy 1021 CCAGGTAACAGGTTTCGAACAAACAAGAAGGCCAAAATTTGGCGTGATACATTCCTAGTG 1080 

I I I I I I I I I I I I I I I I M I I I ! I I I I I I I II I I I I II I I I I I I I I I II M I I I I I I I I I I 
Db 1436 CCAGGTAACAGGTTTCGAACAAACAAGAAGGCCAAAATTTGGCGTGATACATTCCTAGTG 1495 

Qy 1081 GAAAGAGGCAAATTTCTACGTAAGAAGGAAGAATCCAGCAAGAATATCCAACAGTCAAAT 1140 

I I I I I I I I II I I I I I I I I M I I! I II I I I I II I I I M I I I I I M I II I I I I I I I I II II 

Db 1496 GAAAGAGGCAAATTTCTACGTAAGAAGGAAGAATCCAGCAAGAATATCCAACAGTCAAAT 1555 

Qy 1141 CACTTGCCCAAATATGAACGGGTCAAAGAACTATGCCAGCAGGCCAGGTACCAGACAGCC 1200 

II I I I II I I I I I I I I I I I i I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 1556 CACTTGCCCAAATATGAACGGGTCAAAGAACTATGCCAGCAGGCCAGGTACCAGACAGCC 1615 

Qy 1201 T GT GAACAACC GGGGCAGAAGTGGCAATGCATT GAGGATACATC T GGCAAGC TT C GAAT T 1260 

I I I I I I I I II I I II I I I I II I I I I I I I II I I I I I II II I I I I I I I I I I II I I I I II I I I I 

Db 1616 TGTGAACAACCGGGGCAGAAGTGGCAATGCATTGAGGATACATCTGGCAAGCTTCGAATT 1675 

Qy 1261 CACAAGTGTAAAGGACCCAGTGACCTGCTCACAGTCCGGCAGAGCACGCGGAACCTCTAC 132 0 

II 1 I I M I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I II I I I I II I I I I I I I I I I I I I 

Db 167 6 CACAAGTGTAAAGGACCCAGTGACCTGCTCACAGTCCGGCAGAGCACGCGGAACCTCTAC 1735 

Qy 1321 GCTCGCGGCTTCCATGACAAAGACAAAGAGTGCAGTTGTAGGGAGTCTGGTTACCGTGCC 1380 

I I I I I I M I I I I II I I I I I I I I I II I I I I I I I I I I I I II I I I I II I I I I I M I I I I I I I I 

Db 1736 GCTCGCGGCTTCCATGACAAAGACAAAGAGTGCAGTTGTAGGGAGTCTGGTTACCGTGCC 1795 

Qy 1381 AGCAGAAGCCAAAGAAAGAGTCAACGGCAATTCTTGAGAAACCAGGGGACTCCAAAGTAC 144 0 

II I I I I M I I I I I I II I I II II 1 I II 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 1796 AGCAGAAGCCAAAGAAAGAGTCAACGGCAATTCTTGAGAAACCAGGGGACTCCAAAGTAC 1855 

Qy 1441 AAGCCCAGATTTGTCCATACTCGGCAGACACGTTCCTTGTCCGTCGAATTTGAAGGTGAA 1500 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I 
Db 1856 AAGCCCAGATTTGTCCATACTCGGCAGACACGTTCCTTGTCCGTCGAATTTGAAGGTGAA 1915 

Qy 1501 AT AT AT G AC AT AAAT C T G G AAG AAG AAG AAGAAT T G C AAG T G T T G C AAC C AAG AAAC AT T 1560 

I! I M I I II I I I II 11 I I I I II I II I ! I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 1916 AT AT AT G AC AT AAAT C T G G AAG AAG AAG AAG AAT T G CAAG T G T T G C AAC C AAG AAAC AT T 1975 

Qy 1561 GCTAAGCGTCATGATGAAGGCCACAAGGGGCCAAGAGATCTCCAGGCTTCCAGTGGTGGC 1620 

I I I I I I I I I I I I I II I ! I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 197 6 GCTAAGCGTCATGATGAAGGCCACAAGGGGCCAAGAGATCTCCAGGCTTCCAGTGGTGGC 2 035 

Qy 1621 AACAGGGGCAGGATGCTGGCAGATAGCAGCAACGCCGTGGGCCCACCTACCACTGTCCGA 1680 

I I I I I I I I II li I I I I M I I II I I II I I I I I I I I I I I II I I II I 1 II I I I I I I I II I II 
Db 2036 AACAGGGGCAGGATGCTGGCAGATAGCAGCAACGCCGTGGGCCCACCTACCACTGTCCGA 2095 

Qy 1681 G T GAC ACACAAG TGTTTTATTCTT CC C AAT GAC T C TAT C CAT TGT G AG AGAG AAC T G TAG 1740 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I 
Db 2096 GTGACACACAAGTGTTTTATTCTTCCCAATGACTCTATCCATTGTGAGAGAGAACTGTAC 2155 



Qy 17 41 CAATCGGCCAGAGCGTGGAAGGACCATAAGGCATACATTGACAAAGAGATTGAAGCTCTG 18 00 

II I i I M I I II M i I I I I I I I II I I I II I M I I 1 II I I | I I M I I M U I M I II M I I I 
Db 2156 CAATCGGCCAGAGCGTGGAAGGACCATAAGGCATACATTGACAAAGAGATTGAAGCTCTG 2215 

Qy 1801 CAAGATAAAAT TAAGAAT T TAAGAGAAGT G AGAGGACAT CTGAAGAGAAGGAAGCCT GAG 18 60 

I M I I I II I II I I I I I II I I II I ! I I I I I II I I I II II I II I I I I II I I I I II M I I II I 
Db 2216 CAAGATAAAAT TAAGAAT T TAAGAGAAGT GAGAGGAC AT C T GAAGAGAAGGAAGC C T GAG 2275 

Qy 1861 GAATGTAGCTGCAGTAAACAAAGCTATTACAATAAAGAGAAAGGTGTAAAAAAGCAAGAG 1920 

I ! I t II ! I I I I I I I ! II II 1 M I i I I I I I I M II I I I M II I M I M I II I M I I I II I I 
Db 227 6 GAATGTAGCTGCAGTAAACAAAGCTATTACAATAAAGAGAAAGGTGTAAAAAAGCAAGAG 2335 

Qy 1921 AAATTAAAGAGCCATCTTCACCCATTCAAGGAGGCTGCTCAGGAAGTAGATAGCAAACTG 1980 

I I I II I M I I I I II II I II II I I I I I I M I I M ! II I I I II II I I I I I I II I I i I I I I I I 
Db 2336 AAAT T AAAG AGCC AT CT T CACC CAT T C AAGGAGGC T G C T C AG GAAG T AGAT AGCAAAC T G 2395 

Qy 1981 CAACTTTTCAAGGAGAACAACCGTAGGAGGAAGAAGGAGAGGAAGGAGAAGAGACGGCAG 2 04 0 

I I I I I M I I I I I I I I I I II I I I I II H I I I I I I i I I II I I M I I II I I i I I M I I I II II 
Db 2396 CAACTTTTCAAGGAGAACAACCGTAGGAGGAAGAAGGAGAGGAAGGAGAAGAGACGGCAG 2455 

Qy 2041 AGGAAGGGGGAAGAGTGCAGCCTGCCTGGCCTCACTTGCTTCACGCATGACAACAACCAC 2100 

I M I I I I I I I I I I I I I I I I II I II I I I I I II I I I II I I I I I I I I I I II i I I I I I I I I I I I 
Db 2456 AGGAAGGGGGAAGAGTGCAGCCTGCCTGGCCTCACTTGCTTCACGCATGACAACAACCAC 2515 

Qy 2101 TGGCAGACAGCCCCGTTCTGGAACCTGGGATCTTTCTGTGCTTGCACGAGTTCTAACAAT 2160 

I M I I I I I I I I II I I I I I II I I II I I I II M I I I I I II I II 1 I I I II I I I I I I I II I I II 
Db 2516 TGGCAGACAGCCCCGTTCTGGAACCTGGGATCTTTCTGTGCTTGCACGAGTTCTAACAAT 2575 

Qy 2161 AACACCTACTGGTGTTTGCGTACAGTTAATGAGACGCATAATTTTCTTTTCTGTGAGTTT 2220 

M II II II I I I M I II II I I I I I I II I I II I I I I II I I II I I I I I I I | I I | I | || | || | I 
Db 256 AACACCTACTGGTGTTTGCGTACAGTTAATGAGACGCATAATTTTCTTTTCTGTGAGTTT 2635 

Qy 2221 GCTACTGGCTTTTTGGAGTATTTTGATATGAATACAGATCCTTATCAGCTCACAAATACA 2280 

I I I I I I I II I I I I I I I M I I I i II I I I I I I I I I I I I I I I I I I I I I M 1 I I ! I! I I II I I I 
Db 2 63 6 GCTACTGGCTTTTTGGAGTATTTTGATATGAATACAGATCCTTATCAGCTCACAAATACA 2 695 

Qy 2281 GTG CACAC GGTAGAACGAGGCAT T T TGAAT CAGC TACACG TACAAC TAAT GGAGC TCAGA 2340 

I M I 1 I I M M II M I I I I 1 I I II II ! I I I I M I I I I I II I I II II I I I II I I I II I I I I 
Db 2696 GTGCACACGGTAGAACGAGGCATTTTGAATCAGCTACACGTACAACTAATGGAGCTCAGA 2755 

Qy 2341 AGCTGTCAAGGATATAAGCAGTGCAACCCAAGACCTAAGAATCTTGATGTTGGAAATAAA 2400 

M I I II I I I I I I 1 I II I I I I I M I I I I I I II I I I II I I I II I M I I I I I I I I II I I ! I M 
Db 2756 AGCTGTCAAGGATATAAGCAGTGCAACCCAAGACCTAAGAATCTTGATGTTGGAAATAAA 2 815 

Qy 2401 GATGGAGGAAGCTATGACCTACACAGAGGACAGTTATGGGATGGATGGGAAGGTTAATCA 2 460 

I M M I II M I I I I ! I II I I I I I M I M M I M I II II I I I II I I I I II II I I I M I I I I 
Db 2816 GATGGAGGAAGCTATGACCTACACAGAGGACAGTTATGGGATGGATGGGAAGGTTAATCA 2 87 5 

Qy 2461 GCCCCGTCTCACTGCAGACATCAACTGGCAAGGCCTAGAGGAGCTACACAGTGTGAATGA 2520 

I I I I I I I II 1 I I I I II I II 1 I I I I I II I I I II I I I I I II I I I I I I I I II I I II I I I II I I 
Db 287 6 GCCCCGTCTCACTGCAGACATCAACTGGCAAGGCCTAGAGGAGCTACACAGTGTGAATGA 2 935 

Qy 2521 AAAC AT C TAT GAG TAC AGAC AAAAC T AC AGAC T T AGT C T G G T GGAC T GGAC TAAT T AC T T 2580 

I I I M I I II I I I II I I I I I M I I I I I M M I I M i I I M I M M M I I I M i I I I I II I I 
Db 2936 AAAC ATC TAT GAG TAC AG AC AAAAC TAC AG AC TTAGTCTGGT GGAC T G GAC TAAT TAC T T 2 995 

Qy 2581 GAAGGATTTAGATAGAGTATTTGCACTGCTGAAGAGTCACTATGAGCAAAATAAAACAAA 2640 

I I I I I I I I I I I I I I I I I I I I I I M I I I I II I I I I I II I I I I M I | li I I | | I | | I I | I I I 
Db 2996 GAAGGATTTAGATAGAGTATTTGCACTGCTGAAGAGTCACTATGAGCAAAATAAAACAAA 3 055 



Qy 2 641 TAAGACTCAAACTGCTCAAAGTGACGGGTTCTTGGTTGTCTCTGCTGAGCACGCTGTGTC 2700 

I II It i I I I I II II II II I I ! I I I I M II I I I II 1 I H I 1 1 II I i I I I II I I I I II I I I f 
Db 3056 TAAGACTCAAACTGCTCAAAGTGACGGGTTCTTGGTTGTCTCTGCTGAGCACGCTGTGTC 3115 

Qy 2 7 01 AATGGAGATGGCCTCTGCTGACTCAGATGAAGACCCAAGGCATAAGGTTGGGAAAACACC 27 60 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I II I I I i I I I 

Db 3116 AATGGAGATGGCCTCTGCTGACTCAGATGAGACCCAAGGCATAAGGTTGGGAAAACACC 3175 

Qy 2761 TCATTTGACCTTGCCAGCTGACCTTCAAACCCTGCATTTGAACCGACCAACATTAAGTCC 2820 

II I 1 I I I I M I I I I I II I I I I II I I I I I I I I I I I || I I II I I I I II I I 11 I I I 1 I II I I I 

Db 3176 TCATTTGACCTTGCCAGCTGACCTTCAAACCCTGCATTTGAACCGACCAACATTAAGTCC 3235 

Qy 2821 AG AG AG T AAAC T T GAAT G G AAT AAC GACAT T C C AG AAG T T AAT CAT T T G AAT T C T G AAC A 2880 

I I I I I I I I M I I I I I I I I I M I II I I I I I I I I I I II M I 1 I I I I I I I I I I I I I I I I I I I I 
Db 3236 AGAGAGTAAACTTGAATGGAATAACGACATTCCAGAAGTTAATCATTTGAATTCTGAACA 3295 

Qy 2881 CTGGAGAAAAACCGAAAAATGGACGGGGCATGAAGAGACTAATCATCTGGAAACCGATTT 2 940 

I I I I I I I I I I I I I I I I I 11 I I I I I I I I I I I I I I I I II I M I I I I I I I I I I I I I I I I I I 1 I 
Db 32 96 CTGGAGAAAAACCGAAAAATGGACGGGGCATGAAGAGACTAATCATCTGGAAACCGATTT 3355 

Qy 2941 CAGTGGCGATGGCATGACAGAGCTAGAGCTCGGGCCCAGCCCCAGGCTGCAGCCCATTCG 3000 

I I I II I I I I I I I I I I II I I I I I M I I I I I I II I I 1 I I I I I M I I I I I I I I I I I II I I I I I 
Db 3356 CAGTGGCGATGGCATGACAGAGCTAGAGCTCGGGCCCAGCCCCAGGCTGCAGCCCATTCG 3415 

Qy 3001 CAGGCACCCGAAAGAACTTCCCCAGTATGGTGGTCCTGGAAAGGACATTTTTGAAGATCA 30 60 

I I II I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I 1 I I i I I i I I I II I I II i I I I I I I I 
Db 3416 CAGGCACCCGAAAGAACTTCCCCAGTATGGTGGTCCTGGAAAGGACATTTTTGAAGATCA 3475 

Qy 30 61 ACTATATCTTCCTGTGCATTCCGATGGAATTTCAGTTCATCAGATGTTCACCATGGCCAC 3120 

1 I I 1 I I 11 M I 1 I I I I I I ! I 1 I I M M I I I I I I I I I I I I I II I I I I I I I I I I I I I I I M I 
Db 34 76 ACTATATCTTCCTGTGCATTCCGATGGAATTTCAGTTCATCAGATGTTCACCATGGCCAC 3535 

Qy 3121 CGCAGAACACCGAAGTAATTCCAGCATAGCGGGGAAGATGTTGACCAAGGTGGAGAAGAA 3180 

1 I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I [ I I I I I 1 I 
Db 3536 CGCAGAACACCGAAGTAATTCCAGCATAGCGGGGAAGATGTTGACCAAGGTGGAGAAGAA 3595 

Qy 3181 TCACGAAAAGGAGAAGTCACAGCACCTAGAAGGCAGCGCCTCCTCTTCACTCTCCTCTGA 3240 

I I I I I I I I I I M I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I M I I I M I 
Db 3596 TCACGAAAAGGAGAAGTCACAGCACCTAGAAGGCAGCGCCTCCTCTTCACTCTCCTCTGA 3655 

Qy 3241 TTAGATGAAACTGTTACCTTACCCTAAACACAGTATTTCTTTTTAACTTTTTTATTTGTA 3300 

i I I 1 I I I I I I I I I ! M I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3656 TTAGATGAAACTGTTACCTTACCCTAAACACAGTATTTCTTTTTAACTTTTTTATTTGTA 715 

Qy 3301 AACTAATAAAGGTAATCACAGCCACCAACATTCCAAGCTACCCTGGGTACCTTTGTGCAG 3360 

I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I II I I I I I I M I I I I I I 
Db 3716 AACTAATAAAGGTAATCACAGCCACCAACATTCCAAGCTACCCTGGGTACCTTTGTGCAG 3775 

Qy 33 61 TAGAAGCTAGTGAGCATGTGAGCAAGCGGTGTGCACACGGAGACTCATCGTTATAATTTA 342 0 

I I I i I i I I I I I I I I I I t I I I I 1 I I I 1 I I I I I I I I I I M M I I I I I I I I I I I I I I I II II I 
Db 3776 TAGAAGCTAGTGAGCATGTGAGCAAGCGGTGTGCACACGGAGACTCATCGTTATAATTTA 3835 

Qy 3421 CTATCTGCCAAGAGTAGAAAGAAAGGCTGGGGATATTTGGGTTGGCTTGGTTTTGATTTT 3480 

I I I II I I I I I I I M I I 1 I I I 11 I I I I I I I I I I I M I I I it I II I I I M I I I I II I I 1 I I I 
Db 3836 CTATCTGCCAAGAGTAGAAAGAAAGGCTGGGGATATTTGGGTTGGCTTGGTTTTGATTTT 3895 

Qy 34 81 TTGCTTGTTTGTTTGTTTTGTACTAAAACAGTATTATCTTTTGAATATCGTAGGGACATA 3540 

I I II I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 11 I I II I I 
Db 3896 TTGCTTGTTTGTTTGTTTTGTACTAAAACAGTATTATCTTTTGAATATCGTAGGGACATA 3955 



Qy 


3541 


Db 


3956 


Qy 


3601 


Db 


4016 


Qy 


3661 


Db 


4076 


Qy 


3721 


Db 


4136 


Qy 


3781 


Db 


4196 


Qy 


3841 


Db 


4256 


Qy 


3901 


Db 


4316 


Qy 


3961 


Db 


4376 


Qy 


4021 


Db 


4436 


Qy 


4081 


Db 


4496 


Qy 


4141 


Db 


4556 


Qy 


4201 


Db 


4616 


Qy 


4261 


Db 


4676 


Qy 


4321 


Db 


4736 


Qy 


4381 


Db 


4796 



I I I ! I I I II I I I i M ! I II I I I M i 11 I II 1 I I I I I I I I M I I I I II I I II I I I I I I I I I 
AG TAT AT AC AT G T TAT C CAAT CAAG AT GG C TAG AAT GG TGCCTTTCTGAGTGTC T AAAAC 4015 

TTGACACCCCTGGTAAATCTTTCAACACACTTCCACTGCCTGCGTAATGAAGTTTTGATT 3660 
I II II I I I If I I I I I I I I I I I I I I M I 1 I I I I I I M I I I I I I I I I I I II II I I I I I I II I 
TTGACACCCCTGGTAAATCTTTCAACACACTTCCACTGCCTGCGTAATGAAGTTTTGATT 407 5 

CATTTTTAACCACTGGAATTTTTCAATGCCGTCATTTTCAGTTAGATGATTTTGCACTTT 372 0 
I I I! I II I I I II I II I I II I II I II I M I I S I I I I I S II II I 1 1 I I I I I I I i II I I 11 II 
CATTTTTAACCACTGGAATTTTTCAATGCCGTCATTTTCAGTTAGATGATTTTGCACTTT 4135 

GAGATTAAAATGCCATGTCTATTTGATTAGTCTTATTTTTTTATTTTTACAGGCTTATCA 3780 
I I I II i I I I I I M I M I I I II I I I I M i I I II II I I I I I I I I I I I I I I I I I I I I II I i I I 
GAGATTAAAATGCCATGTCTATTTGATTAGTCTTATTTTTTTATTTTTACAGGCTTATCA 4195 

GTCTCACTGTTGGCTGTCATTGTGACAAAGTCAAATAAACCCCCAAGGACGACACACAGT 384 0 
I I I I I II I I i M I M I II ! I 1 ! I I I II 1 I I I I I! I I ! I I I I I I I II I I II I I M II I I I I 
GTCTCACTGTTGGCTGTCATTGTGACAAAGTCAAATAAACCCCCAAGGACGACACACAGT 4255 

ATGGATCACATATTGTTGACATTAAGCTTTTGCCAGAAAATGTTGCATGTGTTTTACCT 3900 
I I I I II I I I I M M I I M I I I I M I I I i I I I I II M I 1 I I I I I I I I I I I I I M I I I I I I I 
ATGGATCACATATTGTTTGACATTAAGCTTTTGCCAGAAAATGTTGCATGTGTTTTACCT 4 315 

CGACTTGCTAAAATCGATTAGCAGAAAGGCATGGCTAATAATGTTGGTGGTGAAAATAAA 3 960 

I II I I I I I I I I II M I I II M I I I I I II I I I I I i II II I I I I I I I I I I i II i I I M I 1 I I 

C GAC T T GC TAAAAT C GAT T AGCAGAAAGG CAT G GC T AAT AAT GTTGGTGGT GAAAAT AAA 4 375 

TAAATAAGTAAACAAAATGAAGATTGCCTGCTCTCTCTGTGCCTAGCCTCAAAGCGTTCA 4 02 0 
I I I I II I I I I M I I I I I : : M : I :: I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I II I 
TAAATAAGTAAACAAAAWRAARAWWGCCTGCTCTCTCTGTGCCTAGCCTCAAAGCGTTCA 4 435 

TCATACATCATACCTTTAAGATTGCTATATTTTGGGTTATTTTCTTGACAGGAGAAAAAG 4 08 0 

I I I I I M I I I I I I II I I II I I I I I M I 1 I I I I I I I I I I I I I I I I I I I I I I I i I I f I I I I I 

T CAT AC AT CAT AC C T T T AAG AT TGCTATATTTTGGGTTATTTTCTT GAC AG G AG AAAAAG 4 495 

ATCTAAAGATCTTTTATTTTCATCTTTTTTGGTTTTCTTGGCATGACTAAGAAGCTTAAA 4140 
I II I I I I M I I M I 1 I I 1 1 I M I I II I II I I I I II I I I I I I I I I I I I I I I I I I I II I I M 
ATCTAAAGATCTTTTATTTTCATCTTTTTTGGTTTTCTTGGCATGACTAAGAAGCTTAAA 4555 

TGTTGATAAAATATGACTAGTTTTGAATTTACACCAAGAACTTCTCAATAAAAGAAAATC 4200 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I M I I I I I I I I I I I I I I I f I II I I 

T G T T GAT AAAAT AT GAC TAG T T T T G AAT T T AC AC CAAG AAC T T C T C AAT AAAAG AAAAT C 4 615 

AT G AAT G C T C C AC AAT T T C AAC AT AC C AC AAG AGAAG T T AAT T T C T T AAC AT TGTGTTCT 4260 

I I M M I II I I I I II M I I I M I I I I I I I I I I M I II M II 1 I I I I I I I I I I I I I I I I I I 

AT GAAT GC T CC ACAAT T T C AACAT AC CAC AAGAGAAG T T AAT T T C T TAAC AT TGTGTTCT 4 675 

AT GAT TAT T T G T AAG AC C T T C AC CAAG T T C T G AT ATC T T T T AAAGACAT AG T T CAAAAT T 4320 

I I I I I I I I I I I I I I I M I i I M I I I II I I I I I II I M I I I I I I I I I I I I I I I I I II I I I I 

AT GAT TAT T T G T AAG AC C T T CAC CAAG T T C T GAT AT C T T T T AAAGACAT AG T T CAAAAT T 4735 

GCTTTTGAAAATCTGTATTCTTGAAAATATCCTTGTTGTGTATTAGGTTTTTAAATACCA 4380 

II I II I f II I I I I I II I I I I I II IS II I I M M 1 II M M M I I I I I II I I I I I i 11 1 I 1 



I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I II I I I I I I I 
GCTAAAGGATTACCTCACTGAGTCATCAGTACCCTCCTATTCAGCTCCCCAAGATGATGT 4855 



4441 GTTTTTGCTTACCCTAAGAGAGGTTTTCTTCTTATTTTTAGATAATTC^GTGCTTAGAT 4500 

* nC r ' ' ' 1 ' ' 1 ' 1 1 1 f M 1 11 1 1 11 I I 1 I I I I I ! I I I I I I | | | [ | | | | ! | [ | | I I I I | I | I || | 

4856 GTTTTTGCTTACCCTAAGAGAGGTTTTCTTCTTATTTTTAGATAATTCAAGTGCTTAGAT 4915 

4501 AAATTATGTTTTCTTTAAGTGTTTATGGTARACTCTTTTAAAGAAAATTTAATATGTTAT 4560 

„ Q1<: IIIMMIMMi IIIMIII|IMIIIllllllli||||||MIIIIIII||MIIM[ 

4916 AAATTATGTTTTCTTTAAGTGTTTATGGTi^ 4975 

4561 AGCTGAATCTTTTTGGTAACTTTAAATCTTTATCATAGACTCTGTACATATGTTCAAATT 4620 

An „r ' 1 1 1 1 1 1 1 1 [ 1 1 1 1 1 1 1 1 I I I i I I I I I I 1 I I I I I | i [ | | | | | | | | | | | | I I I | | | | | I M 

4976 AGCTGAATCTTTTTGGTAACTTTAA&TCTTTATC 5035 

4621 AGCTGCTTGCCTGATGTGTGTATCATCGGTGGGATGACAGAACAAACATATTTATGATCA 4680 

Crt ,,. 1 1 1 1 1 1 1 1 11 1 1 1 1 M 1 1 1 1 I I I I I I I I I I I I I I II I I I I ! M M I I I I I I II I II M I I 

5036 AGCTGCTTGCCTGATGTGTGTATCATCGGTGGGATGACAGAACAAACATATTTATGATCA 5095 

4681 TGAATAATGTGCTTTGTAAAAAGATTTCAAGTTATTAGGAAGCATACTCTGTTTTTTAAT 4740 

cn „_ 1 1 1 1 ' 11 1 11 1 f f I I I M I i I I I I I I I I I I I I I I I I I I I I | I | | | | | | I I I I I I M M II 

5096 TGAATAATGTGCTTTGTAAA&AGATTTCAAGTTATTAGGAA 51S5 

4741 CATGTATAATATTCCATGATACTTTTATAGAACAATTCTG 4 800 

c , r/ . 1 1 1 1 f 1 1 1 1 1 1 1 1 1 I I I I I I I I I I I I I I I j I I M II I i II I M M I I I I I I I I I I I I I I I 

5156 CAT G TATAATAT T C CAT GATAC T T T TAT AGAACAAT TCTGGCTT C AGGAAAG T C T AGAAG 5215 

4801 CAATATTTCTTCAAATAAAAGGTGTTTAAACTTT 4834 

I I N I I I I I I M I I I I I I I | || | || || | | | | | | | 
5216 CAATAT T TC T TCAAATAAAAGG T GT TTAAAC T T T 5249 



